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Применение комплексного непрерывного 
вейвлет-преобразования Морле 
в обработке аудиосигналов 


В статье предложен модифицированный метод фазового вокодера на основе комплексного непрерывного 
преобразования Морле. Комбинация указанного метода, линейной интерполяции и КИХ-фильтра позволила 
разработать алгоритм изменения темпа сигнала без изменения его тона. 


В современных приложениях профессиональной обработки аудиоданных широко 
используются различные методы преобразований сигнала с целью создания эффектов 
высокого качества. Например, для сокращения времени прослушивания аудиосигнала, 
подготовки цифровых фонограмм, реставрации записей, синтезирования электронной 
музыки, для систем управления партитурой в реальном времени применяют методы 
изменения высоты тона и темпа сигнала. Они позволяют значительно сэкономить время, 
поскольку дают возможность исправлять ошибки или корректировать запись без выпол- 
нения новой. 

Разработка качественных методов изменения темпа проигрывания сигнала без 
изменения его тона является актуальной. На текущий момент имеется несколько под- 
ходов к решению этой задачи. 


Методы изменения темпа сигнала без изменения его тона 


Алгоритмы ЗОГА и РЗОГА [1] основаны на методах анализа и обработки сигнала 
во временной области. Недостатком данных методов является плохое качество звучания 
измененного сигнала и появление в нем различных артефактов. 

Применение метода фазового вокодера [2] и ресемплирования сигнала позволяет 
частично устранить перечисленные недостатки. Ресемплирование сигнала меняет ско- 
рость воспроизведения сигнала за счет изменения его частоты дискретизации. Для этого 
обычно применяют методы интерполяции и фильтрации сигналов. Фазовый вокодер — это 
метод получения частотно-временного представления сигнала при помощи быстрого 
преобразования Фурье (БПФ). Однако БПФ не сохраняет временную информацию о 
сигнале, о времени появления той или иной частоты. Метод кратковременного преобразо- 
вания Фурье (КВПФ) является серией оконных БИФ, перекрывающихся по времени и 
позволяющих за счет фреймового подхода сохранять временную информацию о спектре 
сигнала. 

Один из традиционных подходов к смене высоты тона без изменения длительности 
сигнала состоит в вычислении двухмерного частотно-временного представления сигнала 
описанным выше методом. После этого интервал сетки анализа и фазы коэффициентов 
масштабируются для создания сетки синтеза. Далее выполняется обратное преобразо- 
вание, восстанавливающее звуковой сигнал. Таким образом, алгоритм фазового вокодера 
можно описать последовательностью действий: 
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1. Вычисление фазового вокодера. 

2. Преобразование коэффициентов в полярную форму. 

3. Развертывание фазового спектра и умножение на коэффициент масштабиро- 
вания с. 

4. Восстановление сигнала по новой сетке синтеза. 

Сетка анализа фазового вокодера очень похожа на частотно-временное представле- 
ние сигнала, получаемое в результате непрерывного вейвлет-преобразования (НВП) [3-7]. 
Как и фазовый вокодер, НВП преобразует сигнал в его частотно-временное представ- 
ление. Изменяя компоненты сетки анализа НВП, можно получить эффекты, подобные 
тем, что получаются при помощи вокодера. В отличие от КВПФ, в области высоких 
частот НВП обеспечивает лучшее временное разрешение, а в области низких частот — 
лучшее частотное разрешение. Главное преимущество вейвлетов — возможность полного 
восстановления сигнала, которую не обеспечивает Фурье-преобразование, в частности, 
из-за эффекта Гиббса [5]. Использование окон, которые борются с этим эффектом, 
ухудшает восстановление сигнала на участках его быстрых изменений. 

Свойство переменного разрешения хорошо подходит для представления музыкаль- 
ных и речевых сигналов и поэтому, по мнению авторов, применение НВП позволит 
получить лучший результат (т.е. улучшить качество звучания измененного сигнала), по 
сравнению с фазовым вокодером, у которого разрешение одинаково во всех частотных 
областях. 

Целью данной работы является разработка методики и алгоритма обработки аудио- 
сигнала на основе методов вейвлет-анализа применительно к решению задачи изменения 
темпа сигнала без изменения его тона. 


Постановка задачи 


Для достижения поставленной цели исследования необходимо: 
— выбрать оптимальный базис вейвлет-разложения; 
— на основе его частотных характеристик и правил вычисления вейвлет-преобразования 
разработать методику изменения тона сигнала; 
— для изменения темпа сигнала и сохранения качества звучания выбрать оптимальный 
метод его ресэмплирования. 


Выбор базиса вейвлета и его характеристик 


Математический аппарат непрерывных вейвлет-преобразований (НПВ) хорошо 
описан в [3-5]. Качество анализа сигналов с помощью вейвлет-преобразований зависит от 
выбора информативного базиса. 

В работах [6], [7] показано, что для исследования речевых (РС) и музыкальных 
сигналов наиболее информативным является непрерывный вейвлет Морле, т.к. его базис 


лучше аппроксимирует сигнал: 


12 


ив =е/е 2 (1) 

Зная центр (@) и радиус Лу частотного окна базового вейвлета ((@) = 5, А»з= 0,7071 [6], 

пользуясь правилом квантования масштабирующей переменной а и формулой для 

определения ширины частотного окна (2), можно получить значения границ полос 
пропускания вейвлет-фильтров на каждом уровне разложения т: 


тт =[(6)/ад' Ау / 40’; (6)! ад’ + Ау /а0'], Лит 3 < Лпах. (2) 
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Форма АЧХ зависит как от самого анализирующего вейвлета, так и от набора 
масштабов, на которых выполняется преобразование. Для этого вычисляются начальный 
(3) и конечный (4) уровни разложения, на которых осуществляется обработка и анализ 


сигнала: 
ИИ. и 


Лит = № р 


2л/, (3) 
Лпах = ов в) р (4) 


где ш() — округление до ближайшего целого. 

В данной работе границы частотного диапазона исследуемых сигналов [/; 2| и их 
частота дискретизации // обозначены следующими величинами: / = 50Гц; Ь=20 КГц 
(у музыкального сигнала более широкий спектр, чем у РС); /и = 44100Гц. 

Начальный и конечный уровни разложения сигналов (шаг масштабирования = 1,1) 
определяются по формулам (3 — 4) и составляют значения /ии= 6 И ] мах =70. 

Для изменения тона сигнала и соответственно для расчета фазового спектра 
сигнала необходимо применить комплексное непрерывное вейвлет-преобразование 
(КНВП) Морле. 


Методика применения КНВП Морле 
для построения фазового вокодера 


1. Вычисление коэффициентов КНВП Морле: 


М№-—1 
Ятп = СРИТ; (т, п) = Лт (04: (5) 
1=0 
т=ЬР, п=0, М-1, где ДЕ — шаг квантования по времени. 
На рис. | показан пример спектра (а) исходного сигнала и его амплитудно-времен- 
ное представление (6). Для наглядности примера был выбран монохроматический сигнал 
с частотой 500 ГЦ. 


Ред. 20. 
“ооолте 00:00:00,243 '00:00:00,292: 00:00:00,341 


а) 6) 


Рисунок 1 — Исходный сигнал у = 500 Ги : а) — спектр сигнала; 


6) амплитудно-временное представление сигнала 


2. Вычисление амплитуды коэффициентов: 


А(т, п) = /СБИТ,,(т, п)? + СРИТ (т,п)?. (6) 
3. Вычисление фазового спектра 
Ф(т, п) = ага (СРИТ (т, п) / СРИТ,,(т,п)). (7) 
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4. Развертывание фазового спектра путем прибавления к выборкам главного значе- 
ния фазы (п. 3), величин, равных 2лт, где т — целое число. Значения т определяются 
пугем сравнения соседних отсчетов фазы, образовывая так называемую корректирующую 
последовательность. 

5. Вычисление новых коэффициентов на каждом уровне разложения с учетом 
коэффициента сдвига с: 

СИТ, (т, п) = А(т,п)соз(Фии (т, п)-с) (8) 
СРИТ а (т, п) = А(т, п) зт( Фи, (т,п)-с). (9) 
6. Сдвиг уровней на величину 105,с. 


7. Восстановление сигнала при помощи обратного НВП (рис. 2): 
_ Е я М-1 
Ла=- > УАтмтИ”) (10) 
Й т 1=0 


00:00:00,295. 00:00:00,363 00:00:00,443 00:00:00,517 


а) 6) 
Рисунок 2 — Восстановленный сигнал со сдвигом на октаву вверх ( и’ = 1000 Ги): 
а) спектр сигнала; 6) амплитудно-временное представление сигнала 


Если необходимо выполнить изменение темпа без изменения тональности, то до- 
полнительно выполняется ресемплирование — изменение частоты дискретизации в с раз. 


Ресемплирование сигнала 


Ресемплирование сигнала применяют для изменения темпа его воспроизведения в 
некоторое количество раз с с сохранением тональности звучания. Для этого изменяется 


с 
ресемплирование). Если с < /, т.е. темп воспроизведения замедляется, то после изменения 
высоты тона в сторону повышения частота дискретизации увеличивается за счет 
добавления нужного количества новых отсчетов хо.) между двумя уже существующими 
отсчетами сигнала /(х.) и /(Хь) через равные промежутки времени. При этом значения 
новых отсчетов рассчитываются при помощи линейной интерполяции: 


- 
Хо.) = ло.) + Л, 
(хь И Ха ) 
1 
Количество вставляемых отсчетов равно — — 1. 
С 


1 1 
высота тона в — раз, а затем и частота дискретизации сигнала также в — раз (то есть 
(6 


х.). (11) 


Для устранения высокочастотного шума выполняется сглаживание сигнала КИХ- 
фильтром. 

Если с >1 (темп увеличивается), то выполняется сдвиг тональности исходного сиг- 
нала в сторону низких частот, далее частота дискретизации уменьшается в с раз путем 
удаления через равные промежутки времени с- / отсчетов (прореживания) полученного 
сигнала. 
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Таким образом удается сохранить тональность звучания исходного сигнала. 
На рис. 3 в качестве примера приведен ресемплированный сигнал, уменьшающий 
темп произведения (с = 2). 


5000. 


О 000042 000000552 60:00:00.142 00.00.0032 00004 р 
а) 6) 
Рисунок 3 — Ресемплированный сигнал: а) спектр сигнала; 
6) амплитудно-временное представление сигнала 


Выводы 


В статье предложен алгоритм расчета вейвлет-коэффициентов КНВП Морле, учи- 
тывающий локализацию базисной вейвлет-функции на каждом уровне разложения; рас- 
считаны минимальный и максимальный уровни разложения по исследуемому базису, 
центральные частоты и полосы пропускания фильтров и их АЧХ; предложен модифици- 
рованный алгоритм фазового вокодера на основе НКВП Морле. 

Разработан алгоритм изменения темпа сигнала без изменения его тона. Для этого 
применены линейная интерполяция и КИХ-фильтр. 
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А.В. Ященко, Т.С. Хашан 

Застосування комплексного безперервного вейвлет-перетворення Морле в обробщ аудюсигналв 

У стати запропоновано модифижований метод фазового вокодеру, що заснований на комплексному 
безперервному вейвлет-перетворенн! Морле. Ком@нащя цього методу, лин! 1нтерполяци та КГХ-фильтра 
дозволила розробити алгоритм змйни темпу сигналу без змйни висоти його тону. 
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